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临床 试验 不 依从 现象 下 相关 数据 的 统计 推断 * 


RO 君 ， 张 忠 占 
(北京 工业 大 学 应 用 数理 学 院 ， 北 京 100124) 
摘 E 假定 在 临床 试验 中 必需 考虑 受 试 者 服药 状态 相关 性 以 及 受 试 者 协 变量 对 治疗 效果 产生 的 影响 。 本 
文 证 明了 治疗 效果 参数 在 这 一 假设 下 依然 有 具有 可 识别 性 。 利 用 依从 者 治疗 效果 参数 的 近似 极 大 似 
然 估 计 ， 本 文 构造 了 此 参数 的 记分 检验 统计 量 。 模 拟 试验 表明 ， 即 使 对 较 小 样本 ， 该 检验 方法 犯 
第 一 类 错误 的 概率 也 接近 给 定 的 检验 水 平 。 
关键 词 : 不 依从 现象 ， 工 具 变量 ， 相 关 数 据 ， 记 分 检验 


分 类 号 : AMS(2000) 62P10 中 图 分 类 号 : 0213 文献 标识 码 : A 
1 引言 


临床 试验 中 出 现 部 分 受 试 者 不 能 完全 按照 治疗 方案 接受 治疗 的 现象 称 为 不 依从 现象 。 该 现 
象 的 出 现 ， 破 坏 了 随机 化 试验 的 模型 基础 ， 导 致 响应 变量 不 能 完全 反映 治疗 效果 ， 给 治疗 效果 
估计 带 来 困难 。 考 虑 受 试 者 协 变量 对 治疗 效果 有 影响 这 一 因素 ， 也 使 该 统计 推断 问题 更 加 复 

定义 二 分 变量 吃 表 示 受 试 者 服药 状态 ， 二 分 变量 Y 表示 受 试 者 治疗 响应 结果 。 治 疗效 果 表 
现 为 同一 名 受 试 者 服用 药物 (D = 1) 下 潜在 响应 变量 Yip-i) 与 服用 安慰 剂 (D = 0) 下 潜在 响应 
FRY po 的 差异 。 对 于 同一 名 受 试 者 ， 不 能 同时 观测 到 洪 在 治疗 响应 变量 Yi1) 和 Yio)， 只 能 
观测 到 Y = Yoy D 十 Yio) . (1 - D)， 因 此 不 能 直接 计算 每 个 受 试 者 的 治疗 效果 Yj) — Yo). 

Imbens 和 Angrist 提出 用 工具 变量 法 推断 治疗 参数 。 引 入 工具 变量 2 表示 设计 试验 分 组 
状态 ， 在 受 试 者 服用 药物 或 安慰 剂 前 首先 对 受 试 者 进行 分 组 (治疗 组 2 = 1， 对 照 组 2 = 0)。 
定义 二 分 变量 Da 表示 在 设计 试验 分 组 2 = z 下 潜在 治疗 状态 指示 变量 23。 利 用 潜在 试验 状 
SARE Da 和 Do) 把 总 体 分 为 四 组 。 依 从 者 (D(1) > Do) BRERA (Day) = Do = 1)， 
从 不 服药 者 (D = Do = 0)， 违 背 者 (D < Do)。 试 验 状态 指示 变量 可 以 表示 为 刀 = 
Z: Do) +(1- Z): Do。 试 验 中 可 以 观测 到 2 和 刀 ， 但 不 能 同时 观测 到 同一 受 试 者 的 两 个 潜在 
试验 状态 变量 Do) 和 Do ， 因 此 我 们 不 能 识别 个 体 属于 哪 一 组 。 定 义 变量 Xda) 表示 受 试 者 分 
组 在 z 组 、 服 药 状态 在 d 组 下 ， 受 试 者 潜在 治疗 响应 结果 人 & 引 。 若 某 个 体 Do = 0， 将 不 能 观测 
到 此 个 体 的 变量 ZXob。 

Imbens 和 Angrist 在 不 考虑 协 变量 对 治疗 效果 有 影响 的 条 件 下 ， 给 出 一 个 简单 工具 估计 
量 ， 可 以 识别 依从 者 的 平均 治疗 效果 。Imbens # Rubin, Abadiel®! 提出 在 相同 假设 下 可 以 
识别 依从 者 潜在 治疗 响应 的 边缘 分 布 。Abadielel 进一步 研究 针对 协 变量 对 治疗 效果 有 影响 的 情 
况 ， 证 明了 在 给 定 协 变量 的 条 件 下 ， 依 从 者 平均 治疗 效果 是 可 识别 的 。 
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以 上 讨论 都 限定 了 受 试 者 在 临床 试验 中 相互 独立 不 受 彼此 干扰 这 一 条 件 ， 即 假设 临床 试验 
中 可 观测 到 受 试 者 的 数据 O = (X, Z, D,Y) 相互 独立 ， 其 中 X 表示 受 试 者 在 随机 试验 前 的 协 变 
量 ， 如 性 别 、 年 龄 等 基线 水 平 。 

而 在 实际 临床 试验 中 还 会 出 现在 同一 区 域 (病房 、 试 验 中 心 ) 内 的 受 试 者 在 服药 期 间 相 互 影 
响 的 现象 。 比 如 ， 同 一 区 域内 受 试 者 的 依从 性 可 能 受到 趋同 心理 的 影响 。 这 种 相关 性 对 治疗 效 
果 的 评估 存在 一 定 影响 ， 本 文 将 针对 此 类 现象 ， 考 虑 反映 受 试 者 服药 变量 间 存 在 相关 性 情况 
下 ， 治 疗效 果 参 数 的 统计 推断 问题 。 

第 二 节 ， 我 们 利用 工具 变量 法 ， 将 模型 扩展 到 受 试 者 服药 状态 相关 的 情况 ， 并 证 明治 疗效 
果 的 可 识别 性 。 第 三 节 ， 考 虑 受 试 者 分 为 m 组 ,第 i 组 nh; 人 ,i = 1,… ,m， 组 间 受 试 者 服药 
状态 独立 ， 组 内 受 试 者 服药 状态 相关 的 情况 。 根 据 治 疗效 果 的 可 识别 性 ， 利 用 治疗 效果 参数 的 
极 大 似 然 估 计 ， 构 造 记分 检验 统计 量 。 第 四 节 ， 在 特殊 模型 Logit 模型 和 受 试 者 服药 状态 相关 
性 的 假定 下 计算 检验 统计 量 。 第 五 节 ， 进 行 模拟 研究 ， 考 察 检验 方法 的 优 劣 。 


2 ”相关 数据 下 的 识别 问题 


以 下 假设 是 针对 解决 识别 问题 而 提出 ， 应 用 于 很 多 文章 中 。 

假设 2.1 (i) 工具 变量 的 独立 性 : 在 给 定 匀 的 条 件 下 ， 随 机 疝 量 (Yoo) Yo1), Yao); Ya), 
Do); DW)) 与 2 独立; 

(区 ”工具 变量 的 不 相 容 性 ，P(Yad = Ytog) | XX) = 1， 对 任意 的 de {0,1}; 

(iii) 第 一 阶段 : 0< P(Z = TIX) < 1， 并 且 P(Day =1|X) > P( Do = 1|X); 

(iv) 单调 性 : P(Da) > Do)|X) =1。 

车 假设 2.1 成 立 ， 则 称 工具 变 量 Z 是 有 效 的 。 

假设 2.1 的 (i) 保 证 试验 分 组 完全 随机 化 。 假 设 2.1 的 (ii 表示 工具 变量 Z 只 是 通过 DD 对 潮 
在 治疗 响应 变量 作用 ， 即 变量 对 响应 的 唯一 影响 是 通过 在 临床 试验 中 的 服药 状态 体现 ， 因 
此 对 相同 的 关 有 Yo， = Yoo) = Yao 和 Yo) = You = Yan 成 立 。 假设 2.1 AY (iii) 保证 在 条 
件 革 下 Z 和 也 相关 ， 并 进一步 暗示 在 2Z = 1 下 X 的 支撑 与 在 2 = 0 条 件 下 XX 的 支撑 相同 。 
假设 2.1 的 (iv) 排除 了 违背 者 的 存在 ， 并 定义 总 体 分别 为 总 是 服药 者 、 依 从 者 和 从 不 服药 者 三 
组 。 

接 下 来 ， 针 对 nn 个 受 试 者 间 服 药 变 量 D;, i = 1,.… ,n， 相 关 的 情况 ， 分 析 治 疗效 果 参 数 的 
可 识别 性 。 

WY = (Yis Yn), 卫 =(D , Dn), X = (Xi,... ,Xn)e 

定理 2.1 Sg()A (Y,D, X) 的 任意 可 测 实 值 函 数 ， 满 足 刀 jg(Y,D, 和 X)| < co。 定义 


Kn =1- > 


zi=0,1 
i=l, e,n 


Mi ZA -Zaa — Mi DF(1 ~ D) 
P(Z1 = 21, ,Ln = Zn | Xi ,Xn) í 


在 假设 2.1 条 件 下 


1 


=- Elk,.g(Y,D,X) 
PD > Do)) [ ( 


E[g(¥, D, X)| Do) > Do] 


成 立 。 其 中 Da) = (Dim ; Day); Do) = (Dito),* , Dn(0)), Day > Do) 是 指 Dig) > 
Diop Daa) > Dno) 同时 成 立 。 
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特别 地 ， 当 n = 2 时 ， 即 Di 与 Dz 相关 ， 则 有 
Elg(Yi, Yz, Di, D2, X1, X2) | Di0) > Die), D20) > D2(0)] 


1 
| 
P(Dia) > Dye), D20) > D200)) [ro 90 1, Da, X1, Xo)] 





其 中 
ko = 1- PEA = Z2)(1 = 1- D) = Da) _ (1 = 21) Za(1 — U — Di) Da) 
ae P(Z, = 0, Z2 = 0| Xi, X2) P(Z, = 0, Z = 1| Xi, X2) 
Zi(1 = Z) (1 — D1(1 = D2)) ZZo(1 — Dı D2) 
P(Z =1,2Z, =0|X1,X2)  P(Z, = 1,2, =1| Xi, X2) 
成 立 。 


注 2.1 此 定理 对 D1,.… ,D, 相关 或 不 相关 都 成 立 ， 从 而 推广 了 Abadil 的 结果 。 定 理 的 
证 明 参 见 附录 。 

注 2.2 当 9(Y,D,X) = 1 时 ， 我 们 能 够 得 到 [kn] = P(Da) > Do)， 所 以 可 以 把 en 看 
作 权 重 来 识别 依从 者 的 期 望 。 定 理 2.1 表明， 对 依从 者 来 说 ， 条 件 义 下 ，D 具有 外 源 性 ， 不 由 
受 试 者 自身 性 质 决 定 ， 所 以 定理 2.1 可 以 用 于 识别 总 体 中 依从 组 的 临床 试验 参数 。 


3 ”模型 假设 及 推断 


我 们 考虑 受 试 者 在 临床 试验 过 程 中 被 分 成 m 个 小 组 (比如 病房 )， 在 第 i 组 里 有 ni 个 受 
试 者 。 对 于 第 i 组 里 第 ;个 成 员 ，Yi; 表示 其 响应 变量 即 治疗 响应 结果 ;Xij 表示 其 p 维 协 变 
fh; Dya) 表示 其 潜在 服药 状态 指示 变量 ， 则 Dyn A Djo 分 别 表示 成 员 被 分 到 治疗 组 和 
对 照 组 后 潜在 的 服药 状态 ，Dj 表示 其 在 临床 试验 中 实际 服药 状态 ， 其 中 


m 
i=1,-,m, 7 = 1,.. mi, 》 y= Nn. 
2 一 1 


D7 = (Di Da)，DT= (DT ,DET), Z = (2 Zin) 
Z7 = (Zt 27), KE = (Kage ,Kins), XT =(X], ,XT), 
Yi = (Yas Yim) Y7 = (¥T,--- Yn) 

Dizo = (Das) ;Dini(zin)), Di = (Diz)  DmZn)) 


假设 3.1 (i) 同一 病房 内 受 试 者 服药 相互 影响 ， 不 同 病 房 的 受 试 者 服药 不 受 影响 ， 即 组 
内 Dij Di 相关 ，j AK, Al Dij 与 Dmna 独立 ，i xm; 

(ii) 受 试 者 所 服药 物 对 自身 治疗 响应 的 作用 不 受 其 他 受 试 者 影响 , 即 组 内 Yi; | Dij 与 Yi | Dik 
条 件 独立 ，; Ak; 

GD ” 设 每 个 成 员 响 应 变量 与 服药 量 和 协 变 量 有 如 下 的 模型 结构 


E[Y|D,X, Da) > Dio} = h(aD + X78), 
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其 中 函数 h(.) WHEAT, hC) € [0, 1]; 未 知 参数 为 9 = (a, BT)", a RUT BW DIF 
响应 的 影响 ， 即 治疗 效果 参数 ，B 反 映 了 受 试 者 自身 因素 对 治疗 响应 的 影响 程度 。 那 么 a 即 
为 感 兴趣 参数 ， 为 多 余 参数 。 

在 给 定 协 变量 的 条 件 下 ， 记 PCY; = yi |Dig = dij, Xy = ryn 四 表示 第 ;组 第 7 个 成 
A Ya 的 条 件 概率 ，P(Y = y; [Di = di, Xi = xi; 0, 8) 表示 第 i 组 成 员 Y; 的 条 件 概率 , PCY, = 
yaDi = di|Xi = xiia,D) 表 示 第 ?组 成 员 Yi AD RARER, PW: = y, D: = di|X; = 
xi 0, B; Dio) > Dito)) 表示 依从 者 中 第 ;组 成 员 的 联合 概率 。 

利用 定理 2.1 得 到 


E[InP(Yi = y; Di = di | Xi = x;; a, 8) | Dia) > Dio] 


1 
= =E 
P(Di;a) > Dio) 


可 以 用 方程 的 右边 代替 左边 的 对 数 似 然 函 数 来 构造 估计 方程 。 从 而 ， 我 们 可 以 通过 极 大 化 


[kiln P(Y; = yi, D; = di | X; = xi; a, P)|. (1) 





1 ini 
l(a, B;y,d|x) = oe In P(Y; = y;, D; = di | Xi = xi; a, 8), (2) 


i=1 J 


来 估计 未 知 参数 。 其 中 Pp, 是 P(Dia) > Dio) 的 估计 


D1 digziy Di dig (1 — ziz) 
Dea a 
Lje žij doje (l — ziz) 


Kin, 相应 于 定理 2.1 kns BI 











1, Zi = di, 
kin =4 1 2 其 他 
Mi Ceke e TES, 
223=0,1 Mi 5 
由 (2) RA 
l(a, B;y,d|x) = 5 a [In P(Y; = y; | D; = di, X; = xi;0, 8) + In P(D; = d; | X; = xi; a) 
i=1 © Pi 
m Thi 
= >》 Pe D [ys In h(ad;; + zib) + (1— yiz) In (1 — h(adij + «4;8))| 
i=1 t j=l 


+In P(D; = di | X; Saga): 


6 = arg max { 5 Sine | [uij In hladi; + 27,8) 
seo \ <— Pp, pr 5 


+(1 ~ yij) In (1 — hladi + 2%,8))] +1n P(D; = ds] Xi = xis)] X. 
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接 下 来 ， 利 用 a 的 估计 ， 考 虑 构造 a 的 记分 检验 。 记 
hig  h(aDy + XZB), hl; Sh'(aDiy + XZP), hy, Sh" (aD, + XZP). 


定理 3.1 在 假设 3.1 下 ， 检 验 问题 Bo :a=ao 呈 页:axzoao 的 记分 检验 统计 量 可 表示 
A SC(ao) = < Ua(ĝ) E (6) Ua(0 9) « x 


m 
n=) ni 一 oo， 
i=1 
且 存 在 0 < co < cl < 1， 使 得 
ni nj 
co < min — / max — < c 
i n t n 


时 ， 有 SC(ao) = 好 ， 其 中 0 = (a, bT)T, 6 = (ao, bT), BH Ho F BRKI 
即 Us = OM, DU 表示 了 -1 第 一 行 第 一 列 元 素 。Ue, Up, 区 的 形式 如 下 








m Kin; [> yigh dig 一 h; jhi jdij 4 St 
a $ 
ot Pall hs) uf 
Ni 1 
Kin; Yi hiy Ti 一 hijhijTij 
U 一 t 
5 D D; [过 hag (1 — hag) | 


j=l 
Cov(Ua, Ua) Cov(Ua, Ug) 
Cov(Ua, Ug) Cov(Ug, Ug) 


其 中 


人 > 去 ml Dae” |]P(Di = di |X.) 


i=l dij;=0,1 
BAREN 





D3 > | Ma PD. Edie pop, = ds) Xd), 


i P2 ða 
取 值 全 排列 
hi2 
See > PE, ee snug |P Dee dele), 
?一 ig 
取 值 全 排列 


hi2 


Cov(Ua, Ug) = 5 DE RA aby cite . jan PDs = d;|X;). 


i=1 dij=0,1 j=l 
取 值 全 排列 


给 定 检验 水 平 7， 近 似 拒 绝 域 为 R+ = {SC(ao) > x?(1—7)}- 
注 3.1 定理 中 记分 检验 统计 量 渐 近 方 差 的 计算 见 附 录 ， 渐 近 分 布 的 证 明 与 一 般 记 分 检验 统 
计量 渐 近 分 布 证 明 类 似 ， 略 。 
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4 Logit 模型 下 的 统计 推断 


Logit 模型 是 一 个 常见 的 模型 ， 也 称 为 Logistic 回归 模型 ， 本 节 针 对 Logit 模型 和 受 试 者 服 
药 状态 相关 性 的 假定 下 ， 计 算 检验 统计 量 。 

假设 4.1 在 假设 3.1 成 立 的 条 件 下 ， 进 一 步 有 

(i) ” 设 每 个 成 员 响 应 变量 与 服药 量 和 协 变量 有 如 下 的 模型 结构 


Logit E[Y|D,X,Da) > Do] = aD + XTB, 





其 等 价 形式 为 


eaD+X7H 
E[Y ID, X, Day > Do] = Ip eaDtXTp? 
HHhaRRklTAwModOxt aT MV Y 的 影响 ， 即 治疗 效果 参数 ，B 反映 了 受 试 者 自身 因素 对 治疗 
响应 的 影响 程度 。 
(i) 设 第 i 组 各 分 量 取 1 的 概率 相等 旦 与 协 变量 无 关 ， 即 
P(D; = d; |X;) = P(D; = d;), PP(Dil 二 一 P(Di2 =l)= = P(Din = 1) =4q, 
且 g 有 先 验 分 布 
pr ee) A 
Be(e*+a,e%+b) ’ PEO) 
上 述 假设 表明 ， 不 仅 同 一 组 内 个 体 依 从 性 是 相关 的 ， 而 且 个 体 依从 性 可 以 依赖 于 治疗 效果 。 
由 假设 4.1 AY (ii) 可 推出 


Pig 4 P(D; = di) 


L oy a, an 区 
= | Cbs t pS, da (1 — py“ Eji du P 
0 





q~ 


ESTASL: = pre tet 
Be(e® + a, e* + b) 





dp 


"i asi 2 a 
Chr Be(e* +a + S55, dy,e* +b + ni — Oe, di;) 
Be(e + a,e% + b) 





OZ ts Ww" i Tee +a+rm)TL 5 j= =a “ee +b+r2) 
es (2e% +a+b+73) 
计算 In P(D; = di) 对 各 变量 的 一 阶 导 数 
A Oln P(D; = d;) 








Pià ða 
7 e*+a+rı = e*+b+r2 一 \、2ea 十 Q 十 b 十 ra 人 
rı=0 7r2 一 0 r3=0 
` et dij—l Ez 
pa e RPD OS" rir) È Gea) 
eo da 7 20 e*+atry < 2e% +a +b+rz/’ 
Oe ee Ft = 
A n i= di) 
Py = Ob 2 [| > (zara) 
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定理 4.1 在 假设 4.1 下 ， Ho : a = œ > i : a £ oo 的 记分 检验 统计 量 可 表示 
为 SCi(ao) = Ua (JE ()Ua (8). 


n= ni = 0, 
i=l 
且 存 在 0 < co < cl <1, 8 
co < min / max  < c1 
i n 2 n 
时 ， 有 SCi(oao) > x, 其 中 8 = (a, BT, a,b)", 6 = (ao, BT, a,b), B, a, DAWA Ho F B, a, 


6 的 极 大 似 然 估 计 ， 即 分 别 为 Us = 0, Ua = 0, Up = OME, DORRE BAT BF Te 
Ho Ua, Ug, Ua, Us, 吕 形 式 如 下 











m ni adi; +x], B 
Kin, ni eldii taib 
| 2 (its — Ter ) | 
cA Kin, A Kin; 
Ua = 2, Pp Pin U= 2 Pp Pi» 
Cov(Ua, Ua) Cov(Ua,Ug) Cov(Ua,Ua) Cov(Ua, Us) 
» | CUa Us) Cov(Ug, Us) 0 0 
Cov(Ua, Ua) 0 Cov(Ua, Ua) Cov(Ua, Ub) 
Cov(Ua, U») 0 Cov(Ua, Ub) Cov(Us, Us) 
其 中 
oadii+ag8 
Cov(Ua, Ua) were d, + P2,| Po, 


取 值 全 排列 
ecd: itep 


Cov(Ua, Ug) = 5 Dž n 和 ) re T | Pio, 


i=] dij;=0,1 PÈ, j=l 
取 值 全 排列 








Cov(Ua, Ua) = S > PP Pio, 


i=l dij=0,1 
取 值 全 排列 





Cov(Ua, Uy) = 5 Doe Kins Be a A 
i=] dij=0,1 
RALHA 
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e2dij +2758 


Cov(Ug, Up) = 3 Dž “f S repped | Po 


i=1 dij=0,1 PÈ, j=1 





Cov(Ua, Ua) S 5D 党 P2 Pio, 


取 值 全 排列 


m 2 
Kin; 
Cov(Ua, Up) = D DE pz PiaPs Poo, 
i=1 dij=0,1 ~ Di 

取 值 全 排列 


Cov(Us, Us) 35 ae Kn 3 PaP: 


i=1 dij=0,1 
取 值 全 排列 


给 定 检 验 水 平 Y， 近 似 拒绝 域 为 Rt = {SCi(ao) > x?(1 -7)}。 





5 ”模拟 研究 


针对 上 述 结论 进行 模拟 研究 ， 考 察 检验 方法 的 优 劣 。 
1) RERE EIA (Xij, Zij Diz, Vig), i=1… ,mm, f= 1,--+ , n0 
选 定 参 数 真 值 ao = 0, 6 = 0.5, a = 4 b = 4， 产 生 随 机 数 2;; ~ B(1,0.5), Xy ~ 
U(-0.5,0.5), Pp, ~ Be(e? + wec +b), HH Pp, 产生 随机 数 D;; ~ B(1, Pp,)， 代 入 模型 
e2Dij+bXij 


Py; = P(Yig = 1| Dij, Xij, Dija) > Dis) = TeaD tax’ 


产生 随机 数 YY; ~ B(1, Pr )。 

2) 计算 检验 统计 量 SC, 和 拒绝 Hy 的 概率 。 

求解 方程 组 Ug(0, b,a, b) = 0, Ua(0,B,0,b) = 0，Us(0,B,a,b) = 0， 解 得 6, a, 64> HI 
Ñ Ho Fp, ob 的 极 大 似 然 估 计 ， 计 算 记 分 检验 统计 量 ， 进 而 得 到 拒绝 三 o NRE. A 
过 5000 次 模拟 ， 结 果 如 表 1 所 示 ， 包 括 a = 0 下 6, a,b 的 参数 估计 以 及 a = 0 下 拒绝 名 的 


Rl: a = 二 0 下 参数 估计 和 假设 检验 模拟 结果 


B(MSE(8)) a(MSE(4)) b(MSE(6)) 
0.5757(1.7902) 4.1939(0.5971)  4.1963(0.5957) 
0.5460(1.2518)  4.0904(0.1693)  4.0887(0.1706) 
0.5161(0.6559)  4.0210(0.0819)  4.0225(0.0832) 
0.5121(0.2510) 4.0008(0.0334) 4.0011(0.0339) 
0.5648(1.2633) 4.2275(0.3076)  4.2262(0.3050) 
0.5143(0.5706)  4.0982(0.1657)  4.0962(0.1639) 
0.5097(0.3104)  4.0476(0.0814)  4.0497(0.0812) 
0.5090(0.1318)  4.0182(0.0326)  4.0187(0.0327) 





假设 检验 
y=0.05 y=0.01 
0.0454 0.0109 
0.0455 0.0070 




























组 内 n 组 间 m 



















0.0490 0.0096 
0.0510 0.0122 
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设 定 组 内 成 员 数 nn = 5， 组 数 m = 20， 给 定 检 验 水 平 y = 0.05 和 7? = 0.01, Wit 1000 KK 
拟 ， 计 算 功效 结果 如 图 1 和 表 2 所 示 ， 图 1 直观 给 出 功效 值 随 a 取 值 的 变化 趋势 ， 表 2 进一步 


给 出 a 取 值 对 应 的 功效 函数 值 。 


表 1 表 明 ， 针 对 服药 状态 相关 情况 下 ， 记 分 检验 方法 能 够 控制 犯 第 一 类 错误 的 概率 ， 尤 其 
在 总 样本 量 不 大 的 情况 下 ， 也 能 较 好 的 控制 水 平 ， 随 着 组 数 和 组 内 成 员 数 的 增 大 ， 犯 第 一 类 错 
误 的 概率 接近 给 定 的 检验 水 平 。 另 外 ， 模 拟 结果 显示 ， 随 着 组 数 和 组 内 成 员 数 的 增加 ， 参 数 估 
计 的 偏差 及 均 方 误差 (MSE) 迅速 减 小 。 从 图 1 和 表 2 看 出 ， 该 检验 方法 有 很 好 的 功效 ， 当 a 接 


近 土 1.5 时 ， 功 效 接近 1。 








= 


i 











图 1: 


0 ， 
0 02 04 06 08 





假设 检验 方法 功效 函数 图 (检验 水 平 0.05) 


表 2: 功效 函数 值 表 





检验 水 平 了 一 0.05 


检验 水 平 y= 0.01 





7 











a 功效 值 | a ”功效 值 | a aat | a 功效 值 
-2 0.998 | 0.1 0.056 -2 0.990 0.1 0.016 
-1.5 0.982 0.2 0.091 -1.5 0.934 0.2 0.021 
-1.2 0.930 0.3 0.163 -1.2 0.800 0.3 0.049 
-1 0.839 0.4 0.247 -1 0.647 0.4 0.090 
-0.9 0.770 0.5 0.330 -0.9 0.534 0.5 0.145 
-0.8 0.671 0.6 0.444 -0.8 0.413 0.6 0.223 
-0.7 0.574 0.7 0.570 -0.7 0.339 0.7 0.341 
-0.6 0.450 0.8 0.661 -0.6 0.217 0.8 0.399 
-0.5 0.322 0.9 0.740 -0.5 0.135 0.9 0.501 
-0.4 0.259 1 0.835 -0.4 0.116 1 0.618 
-0.3 0.171 1.2 0.945 -0.3 0.048 1.2 0.812 
-0.2 0.109 1.5 0.983 -0.2 0.032 1.5 0.927 
0.999 -0.1 0.023 | 2 0.996 





-0.1 0.067 | 2 
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6 ”结论 与 讨论 


本 文 考虑 受 试 者 服药 状态 相关 的 情况 ， 并 且 服 药 状态 变量 万 的 分 布 与 治疗 参数 有 关 ， 同 时 
考虑 协 变量 对 治疗 效果 有 影响 这 一 因素 。 首 先 给 出 在 该 情况 下 治疗 效果 参数 可 识别 的 结论 ， 接 
下 来 利用 极 大 似 然 估计 构造 记分 检验 统计 量 ， 该 检验 方法 在 满足 假设 2.1 的 条 件 下 ， 进 一 步 假 
RAE D, X 下 YY 的 条 件 概 率 形 式 以 及 也 的 分 布 形式 。 模 拟 研究 中 ， 给 定 特 殊 模 型 进行 模拟 ， 
结果 表明 ， 该 假设 检验 方法 在 大 样本 的 情况 下 ， 犯 第 一 类 错误 的 概率 接近 给 定 的 检验 水 平 ， 样 
本 量 不 大 的 情况 下 ， 也 能 够 控制 犯 第 一 类 错误 的 概率 ， 并 接近 给 定 的 检验 水 平 ， 当 组 内 成 员 数 
和 组 数 增 大 时 ， 检 验 效果 更 为 理想 。 





7 ”附录 


定理 2.1 的 证 明 ”由 于 我 们 考虑 的 是 违背 者 不 存在 的 情况 ， 即 Dia) > Dia), i=l, oan 
因此 D; 的 取 值 为 0, Zi, 1。 那 么 D1,… , Dn 取 值 全 排列 共 3* 项 ， 其 中 一 排列 D; = Zi i = 
1,--- n EHF Da) > Do) 成 立 。 

Wg) = 9Y, p, Yn, Dis, Dn, Xise, Xn) WA FRR 


E{9(-)|X,Da) > Do] 





1 
= P(Da) > Do) |X) {Blot [x] 


Ae S> Elo) |X, Z=2, Di =d,- , Dn = dn] 


zi 二 0,1 d;=0,2;,1 取 值 全 排列 
i=l esn y3, 3 idižzi 


xP(Di = di,- ,Da = dn |X, Z = 2) }. (3) 


根据 假定 条 件 ， 在 给 定 和 条件 下 ，Z 与 (Y,D) 独 立 ， 当 也 =z= (z, ,zn)7 了 时 


2 Elg(-) |X, Di = d1,- +- ,Dn = dn, Z1 = 4, , Zn = 2n] 
di=0,z E SATAN 
V 排列 ,3 dz 
Spine , Dn = dn |X, Z = z3, , Zn = Zn) 
= 1 
= P(Zy = 2) ,Zn = Zn |X) 
nr nr 
xz (1 - [[ De(a - Dy) TI 280 2) 9(-) 1X]. (4) 
i=1 i=l 


注 ARRARIR A. AE KRE, Diis 1,… ,nn 的 取 值 全 排列 中 不 包 
括 D; = Ži, i= l, ,n 这 一 排列 ， 因此 


P(D, = di,- , Dn = dn |X, Zi = z1, , Zn = 2n) =1-[[d( 4) 


di=0,z hd 
v HIS dp #24 
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KURRA (3) 式 ， 两 边 对 义 积分 得 到 


[Fla |X, Da) > Do]daP(XIDa) > Do) 


= = (= Ts DG ~ De) Than 27 EO 
i somo /| wc Z PU a Zn = tn] X) )x]4Pe0, 


即 可 推出 i 


Y,D,X)|Da) > D — 
[9 ( )| (1) w] = P(Day > Do) 


已 [en -9(¥,D,X)], 
其 中 May 2 (1 = Zya — TI, DEO- D) 
kn=1— D ee e a, 


定理 3.1 中 协 方差 的 计算 首先 计算 得 分 函数 





Uala, By,d 
a ee 
Ua(a, B;y,d |x) 
a 人 Kin, 3 (= a dij “IÈ Kini ôln P(D; = d; | Xi; a)/ða 
‘<7 Po: j=l hag (1 — hag) a+ Po; 0 l 
接 王 来 计算 协 方差 阵 。Z(0; y,d|x) 可 以 写 为 独立 和 的 形式 ， 即 
U(0;y,d|x) = SU (8; yidi | xi), 
i=1 
其 中 
Uia PP; ,d 
Ub;yodilxi)= | S 
U;,a(a, p8; y,d |x) 





- ee (Yi; 一 dij Kin; dln P(D; = di | X;; a)/ða 
5 eea Sege 
j=l ate ae a tij Pp; 0 


H U;, 2 三 l, ,9 相互 独立 ， 得 到 Cov[U (6), U (8) = paar. Cov[U; (8), U;(6)]. 在 Ho (a= 
ao F> &6=6, WH E[U,(0;Y;,Di |X; = xi)] = 0 成 立 。 得 到 


Cov [Ui,a(0; Yi, Di | Xi = xi), Ui,a (8; Yi, Di | Xi = xi)| 





Ki [> eT fg Ke a 


= Ey. p, ae 
vob BE hij (1 — hiz) PZ, | da 


i j=1 





K? [> (yij 一 | 的 =d; Gia) 
PÈ, j=1 hij(1 一 hij) 


h+ h+. 
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接 下 来 分 别 计算 五 一 
= k2 ni (Yiz — hig) hi; Diz 12 本 K2 ni hie 
= er 总 [> hij(1 Pas) “| } se lpr 2 hij(1 z TE D; | 


ne 


= Ve A acim heat ‘) d,) P(D; = di|Xi), 


dij=0,1 PÈ, j= 

取 值 全 排列 

dInP i ty 
eee 


aS Bran oe Ba 





2 ea i = di|Xi;a) 


2 





hij (1 — hig) Oa } 





ni (yj 一 Dj dln P(D; =d; eee) a 





P2 hij — hi;) Be 
因此 
Cov [Ua(0; Y,D |X), Va(@;¥, D |X)] 
7 p> PB, To ;) dł;|P(D; = d: |X;) 
g 取信 全 排列 
> oInP(D:; =d; | Xi; a) = 
pe 2 al Oa |’ P(D; = di | Xi), 
本 取信 全 排列 
同 理 推 出 


Cov [Ug(0: Y,D |X), Us(@; Y, D| X)] 
hi2 


m K2 Ny 2 z 
= res ies —_—1_ r; -i P(D; = di X;), 
3 pe PS, b> hij(1 = ha) i] ( | i) 
取 值 全 排列 
Cov [Ua(0; Y,D | X),Ua(@;¥,D |X)| 


Z K? h? 
= 2 pa P2, [> hi;(l Ez hi 3) dyzy|P (D; a di | X;). 
取 值 全 排列 
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Inference of Treatment Effects Based on Correlated Data from 
Randomized Trials with Non-compliance 


DAI Jun, ZHANG Zhong-zhan 


(College of Applied Sciences, Beijing University of Technology, Beijing 100124) 


Abstract: Assume that in a trial, the compliances among patients are correlated, and the co-variables 
of patients may affect the evaluation of the treatment. In this paper, we prove the identifiability of the 
treatment effect. Based on an MLE of parameters, a score test is constructed for the treatment effect. 
Simulation results show that the score test can control type I error even for small samples. 
Keywords: non-compliance; instrumental variable; correlated data; score test 
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